\documentclass{article}


\usepackage[utf8]{inputenc}
\usepackage[russian]{babel}
%\usepackage{index}
\usepackage[T1]{fontenc}
\usepackage{indentfirst}
\usepackage{tikz}
\usetikzlibrary{patterns}
\usepackage{mathtext}
\usepackage[sumlimits, intlimits, namelimits]{amsmath}
\usepackage{amsfonts, amssymb, pifont, flexisym, breqn}
\usepackage{mymathutils, mathbreaks, bracemath}
\usepackage[framedtheorems]{mymath}
\usepackage{float}
\usepackage{color}
\usepackage{enumitem}
\usepackage{textcomp}
\usepackage{ifthen}
\usepackage{fullpage}

\definecolor{darkgreen}{HTML}{008000}

\renewcommand{\theoremkwstyle}{\fontfamily{fco}\selectfont\bfseries\color{blue}}
\renewcommand{\theoremtextstyle}{\normalfont\sffamily\color{blue}}
\renewcommand{\definitionkwstyle}{\fontfamily{fco}\selectfont\bfseries\color{darkgreen}}
\renewcommand{\definitiontextstyle}{\fontfamily{fos}\selectfont\color{darkgreen}}

\title{Метод множителей Лагранжа}

\begin{document}
  \maketitle
  Рассматривается задача, не имеющая одномерных аналогов. В самом частном
  случае, она звучит так: определена функция \(f : \realnum^2 \to \realnum\).
  Требуется найти её экстремумы на границе \(\gamma\) некоторого компакта,
  причём, в отличие от рассмотренного до этого метода, параметризация \(\gamma\)
  не дана. Вместо этого \(\gamma\) задана в неявном виде: \[
    L(x, y) = 0
  \]. 

  В общем виде задача выглядит следующим образом: требуется найти экстремумы на
  многообразии, являющемся решением системы из не более, чем \(n\) уравнений вида
  \(L_i(x_1, x_2, \dots, x_n) = 0\) (они называются \emph{уравнениями связей}.%
  \footnote{Если решение уравнения --- несколько точек, то применять метод нет
  смысла: проще подсчитать значения в них непосредственно, и сравнить.}

  Для этого составляется \emph{функция Лагранжа}: \[
    \Phi(x_1, x_2, \dots, x_n) = f(x_1, x_2, \dots, x_n) +
      \sum_{i = 0}^n \lambda_iL_i
  \]. После этого оказывается, что экстремальные точки удовлетворяют условиям:
  \begin{displaymath}
    \left.\begin{aligned}
      \Phi'_{x_1} &= 0 \\
      \Phi'_{x_2} &= 0 \\
      &\cdots \\
      \Phi'_{x_n} &= 0 \\
      L_1(x_1, x_2, \dots, x_n) &= 0 \\
      L_2(x_1, x_2, \dots, x_n) &= 0 \\
      &\cdots \\
      L_n(x_1, x_2, \dots, x_n) &= 0 \\
    \end{aligned}\right\}
  \end{displaymath}

  Далее, чтобы выяснить, какими именно экстремумами являются найденные точки,
  нужно, вообще говоря, исследовать квадратичную форму из вторых производных.
  Для двух переменных это делается, как правило, выделением полного квадрата; для
  большего числа переменных универсального способа нет.

  Однако есть некоторые общие соображения, позволяющие в некоторых случаях
  (а мы будем работать только с такими случаями) определить тип экстремума без
  исследования второй производной:
  \begin{itemize}
    \item
      Если множество, на котором требуется найти минимум и максимум --- компакт,
      то по теореме Вейерштрасса они там есть. Таким образом, если экстремума
      нашлось всего два, то это и есть максимум и минимум. Чтобы определить, кто
      из них кто, достаточно просто сравнить значения функции в этих точках.
    \item
      В случае, если помимо связи, на область рассмотрения наложено ещё и
      какое-то условие в виде неравенства, можно добавить второе неравенство,
      сделав из области рассмотрения компакт. Для этого надо из каких-то
      соображений прикинуть, какой экстремум мы могли найти, и, если это
      минимум, то накладывается ограничение вида ,,координаты не больше чего-то
      большого'', и наоборот в случае максимума. Это рассуждение
      проиллюстрировано примерами.
  \end{itemize}

  \textbf{Пример 1.} Найти минимум функции двух переменных \(f(x, y) = x + y\) на
  множестве решений уравнения \(xy = 1\) при условии \(x, y \ge 0\).

  \textbf{Решение.} Составим функцию Лагранжа: \[
    \Phi(x, y) = x + y + \lambda(xy - 1)
  \]. Найдём её частные производные: \[
    \Phi'_x = 1 + \lambda y
  \], \[
    \Phi'_y = 1 + \lambda x
  \]. Получили систему уравнений:
  \begin{displaymath}
    \left\{\begin{aligned}
      y &= -\frac{1}{\lambda} \\
      x &= -\frac{1}{\lambda} \\
      xy &= 1
    \end{aligned}\right.
  \end{displaymath}

  Отсюда \(\lambda = \pm 1\). Получили две стационарные точки: \((-1, -1)\) и
  \((1, 1)\). Первая из них нас не интересует, так как мы исследуем область, в
  которой \(x, y \ge 0\). Таким образом, кандидат на экстремум --- \((1, 1)\).

  Из общих соображений ясно, что если это экстремум, то это минимум.
  Действительно, мы исследуем \(f(x, y)\) на гиперболе \(xy = 1\), а значит, \[
    f(x) = x + \frac{1}{x}
  \], и сделать её можно сколь угодно большой. Теперь применим описанное выше
  соображение.

  Наложим дополнительное ограничение: \(x, y \le 5\). Тогда рассматриваемое
  множество --- компакт, значит, на нём есть минимум и максимум. Более того, оно
  содержит нашу точку \((1, 1)\) --- кандидат на экстремум. Все кандидаты на
  экстремумы: \(f(5, \frac{1}{5}) = 5.2\), \(f(\frac{1}{5}, 5) = 5.2\), 
  \(f(1, 1) = 2\). Видим, что \(f(1, 1)\) --- минимум. Так как на дополнении
  такой области \(f(x, y)\) только больше, \((1, 1)\) --- точка минимума на всём
  множестве решений уравнения \(xy = 1\).

  \textbf{Пример 2.} С помощью метода множителей Лагранжа доказать неравенство
  о средних: \[
    \frac{a_1 + a_2 + \dots + a_n}{n} \ge \sqrt[n]{a_1 a_2 \dots a_n}
  \].

  \textbf{Решение.} Рассмотрим функцию \[
    f(x_1, x_2, \dots, x_n) = x_1 + x_2 + \dots + x_n
  \]. Найдём её минимум и максимум на множестве решений уравнения \(x_1 x_2
  \dots x_n = 1\) при условии \(x_i = 0\). Для этого построим функцию Лагранжа:
  \[
    \Phi(x_1, x_2, \dots, x_n) = x_1 + x_2 + \dots + x_n + \lambda x_1 x_2 \dots
    x_n
  \]. Её частные производные: \[
    \Phi'_{x_i} = 1 + \lambda \prod_{j \neq i} x_j
  \]. Приравняв их нулю и добавив уравнение связи \(x_1 x_2 \dots x_n = 1\),
  получим систему. Из уравнения связи \[
    \prod_{j \neq i}x_j = \frac{1}{x_i}
  \], поэтому все уравнения для частных производных обращаются в \[
    1 + \frac{\lambda}{x_i} = 0
  \], то есть, \[
    x_i = -\frac{1}{\lambda}
  \]. Так как \(x_1 x_2 \dots x_n = 1\) и \(x_i \ge 0\), получаем, что \(\lambda
  = -1\) и \(x_i = 1\).

  Так, точка \((1, 1, \dots, 1)\) --- кандидат на экстремум. Ясно, что если это
  экстремум, то это минимум, так как \(f(x_1, \dots, x_n) = x_1 + \dots + x_n\)
  на рассматриваемой области можно сделать сколь угодно большой.

  Теперь введём дополнительное ограничение: пусть \(x_i \le n^2\). Теперь
  рассматриваемая область стала компактом, а значит, на ней обязательно есть
  минимум и максимум.
  В точке \((1, 1, \dots, 1)\) получим значение \(f(x_1, \dots, x_n) = \sum x_i
  = n\). На верхней границе --- \(x_i = n^2\), --- очевидно, \(f(x_1, \dots, x_n)
  = \sum x_i \ge n^2\), причём для любого \(i\). Других кандидатов на экстремум
  нет, а значит, \((1, 1, \dots, 1)\) --- точка минимума.

  Таким образом, получаем, что при условии \(x_1 x_2 \dots x_n = 1\), \[
    x_1 + x_2 + \dots + x_n \ge n
  \]. А теперь скажем, что \[
    x_i = \frac{a_i}{\sqrt[n]{a_1 a_2 \dots a_i}}
  \]. Тогда \[
    \frac{x_1 + x_2 + \dots + x_n}{n} =
    \frac{a_1 + a_2 + \dots + a_n}{n\sqrt[n]{a_1 a_2 \dots a_n}} \ge n
  \]. Отсюда получаем требуемое: \[
    \frac{a_1 + a_2 + \dots + a_n}{n} \ge n\sqrt[n]{a_1 a_2 \dots a_n}
  \]. Неравенство верно, так как условие \(x_1 x_2 \dots x_n = 1\) выполняется:
  \[
    x_1 x_2 \dots x_n = \frac{a_1 a_2 \dots a_n}{\left( \sqrt[n]{a_1 a_2 \dots
    a_n} \right)^n} = 1
  \].

  \newpage

  Теперь к вопросу о том, откуда вообще взялся метод множителей Лагранжа, и
  какой смысл несут эти загадочные множители \(\lambda\). Для того, чтобы это
  разъяснить, ограничимся случаем двух переменных: пусть \(f : \realnum^2 \to
  \realnum\).

  Предположим, что параметризация у нас задана. Тогда \(f(x, y)\) можно
  превратить в функцию от \(t\): \(f(x(t), y(t))\). Возьмём от неё производную
  по \(t\), и приравняем её нулю: \[
    f'(x(t), y(t)) = f'_xx'(t) + f'_yy'(t) = 0
  \]. Это можно переписать в виде \[
    \frac{f'_x}{f'_y} = -\frac{y'(t)}{x'(t)}
  \]. Так как \(f(x(t), y(t))\) --- функция от \(\realnum\), это уравнение даёт
  нам точки-кандидаты на экстремум.
  
  Также, уравнение \(L(x, y)\) для \(t\) должно выполняться тождественно: \[
    L(x(t), y(t)) \equiv 0
  \]. Возьмём от него производную по \(t\), она тоже будет равна нулю: \[
    L'(x(t), y(t)) = L'_x x'(t) + L'_y y'(t) = 0
  \]. Это можно переписать в виде \[
    \frac{L'_x}{L'_y} = -\frac{y'(t)}{x'(t)}
  \]. Так, имеем \[
    \frac{f'_x}{f'_y} = \frac{L'_x}{L'_y} = -\frac{y'(t)}{x'(t)}
  \]. Это можно переписать в виде \[
    \frac{f'_x}{L'_x} = -\lambda = \frac{f'_y}{L'_y}
  \]. Определим \(\lambda\) таким образом. Тогда, рассмотрев оба равенства по
  отдельности и преобразовав, получим систему уравнений:
  \begin{displaymath}
    \left\{\begin{aligned}
      f'_x + \lambda L'_x &= 0 \\ 
      f'_y + \lambda L'_y &= 0 
    \end{aligned}\right.
  \end{displaymath}
  Очевидно, это то же самое, что 
  \begin{displaymath}
    \left\{\begin{aligned}
      (f + \lambda L)'_x &= 0 \\ 
      (f + \lambda L)'_y &= 0 
    \end{aligned}\right.
  \end{displaymath}
  Функция Лагранжа так и определяется: \(\Phi = f + \lambda L\). Смысл так
  делать в том, что хочется записать условие на экстремум в виде равенства нулю
  частных производных какой-то функции. Сама функция \(f\), увы, не подходит,
  зато подходит \(\Phi\).
\end{document}
